AI资讯新闻榜单内容搜索- DeepSeek-

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
搜索:  DeepSeek-
全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

全球首发:QwQ-32B本地一键部署、3090单卡可跑,共享算力成关键

仅仅过了一天,阿里开源的新一代推理模型便能在个人设备上跑起来了!昨天深夜,阿里重磅开源了参数量 320 亿的全新推理模型 QwQ-32B,其性能足以比肩 6710 亿参数的 DeepSeek-R1 满血版。

来自主题: AI资讯
9037 点击    2025-03-07 17:12
百度文库、网盘接入 DeepSeek,这才是学生党真正想要的 AI

百度文库、网盘接入 DeepSeek,这才是学生党真正想要的 AI

百度文库、网盘接入 DeepSeek,这才是学生党真正想要的 AI

又一个「DeepSeek 王炸组合」,来了。2 月 28 日,两个国民级应用,百度文库和百度网盘,全量接入了 DeepSeek-R1 满血版。

来自主题: AI资讯
4305 点击    2025-03-06 10:34
第一个吃到DeepSeek红利的AI图像产品出现了?

第一个吃到DeepSeek红利的AI图像产品出现了?

第一个吃到DeepSeek红利的AI图像产品出现了?

在 R1 推理模型大火之后,全民接力集成 DeepSeek,有硅基流动这样的大模型云服务平台、有腾讯元宝这样的 Chatbot,甚至微信这样的顶流。但是,AI 图片类产品却鲜少有接入 DeepSeek R1 的新闻,而从 DeepSeek-R1 发布到 Krea 宣布上线新功能仅仅 10 天,这个反应应该是图像产品中最快的。

来自主题: AI资讯
4151 点击    2025-03-05 10:16
视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

视觉强化微调!DeepSeek R1技术成功迁移到多模态领域,全面开源

通过针对视觉的细分类、目标检测等任务设计对应的规则奖励,Visual-RFT 打破了 DeepSeek-R1 方法局限于文本、数学推理、代码等少数领域的认知,为视觉语言模型的训练开辟了全新路径!

来自主题: AI技术研报
7469 点击    2025-03-04 20:09
DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

DeepSeek关键RL算法GRPO,有人从头跑通了,贡献完整代码

GRPO(Group Relative Policy Optimization)是 DeepSeek-R1 成功的基础技术之一,我们之前也多次报道过该技术,比如《DeepSeek 用的 GRPO 占用大量内存?有人给出了些破解方法》。

来自主题: AI技术研报
9462 点击    2025-03-02 15:14
一文详解:DeepSeek 第三天开源的 DeepGEMM

一文详解:DeepSeek 第三天开源的 DeepGEMM

一文详解:DeepSeek 第三天开源的 DeepGEMM

DeepSeek 开源周的第三天,带来了专为 Hopper 架构 GPU 优化的矩阵乘法库 — DeepGEMM。这一库支持标准矩阵计算和混合专家模型(MoE)计算,为 DeepSeek-V3/R1 的训练和推理提供强大支持,在 Hopper GPU 上达到 1350+FP8 TFLOPS 的高性能。

来自主题: AI技术研报
7735 点击    2025-02-26 10:46
从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

从o1-mini到DeepSeek-R1,万字长文带你读懂推理模型的历史与技术

自 OpenAI 发布 o1-mini 模型以来,推理模型就一直是 AI 社区的热门话题,而春节前面世的开放式推理模型 DeepSeek-R1 更是让推理模型的热度达到了前所未有的高峰。

来自主题: AI技术研报
9061 点击    2025-02-24 14:40
DeepSeek引发鲶鱼效应,中国算力市场呈现“四变”

DeepSeek引发鲶鱼效应,中国算力市场呈现“四变”

DeepSeek引发鲶鱼效应,中国算力市场呈现“四变”

这个AI领域千亿级市场,将辐射千家万户。 DeepSeek-R1横空出世,打响了大模型比拼性价比的第一枪。 Meta、OpenAI等国外头部大模型厂商纷纷复刻或变相降价。比DeepSeek-R1晚两周发布的OpenAI o3-mini模型,定价比前代模型o1-mini降低了超6成,比前代完整版的o1模型便宜超9成。

来自主题: AI资讯
9698 点击    2025-02-19 09:38